Serviceorientiertes Datenqualitätsmanagement auf Basis von Open Source Tools

نویسندگان

  • Julia Klingner
  • David Ramón Engelhardt
  • Holger Hinrichs
چکیده

Unternehmen sind heute mehr denn je auf qualitativ hochwertige Datenbestände angewiesen, sei es zur effizienten Abwicklung des Tagesgeschäfts oder zur taktischen und strategischen Entscheidungsunterstützung. Unvollständige, inkonsistente oder redundante Daten stören den Prozessablauf, führen zu Nachbearbeitungsaufwänden und gefährden Managemententscheidungen. Umso wichtiger ist es, Datenqualitätsmängel möglichst frühzeitig zu erkennen. Wendet man den klassischen PDCA-Zyklus nach Deming [De82] auf den Bereich Datenqualität an, müssen zunächst in einer Planungsphase (Plan) aktuelle Qualitätsanforderungen an Daten sowie Messinstrumente spezifiziert werden. Bei der Ausführung von Geschäftsprozessen (Do) wird laufend die Datenqualität gemessen. Die anschließende Analyse von Messergebnissen (Check) führt – je nach Bedarf – zum Ergreifen von Verbesserungsmaßnahmen (Act), z. B. einer Datenbereinigung oder Ursachenbekämpfung. In dem studentischen Projekt DServ (Serviceorientiertes Datenqualitätsmanagement) wurde eine Softwarelösung konzipiert und implementiert, die insbesondere die Phasen Plan, Do und Check unterstützt. Die Messung der Datenqualität erfolgt dabei über einen Satz von Web Services, die mit dem Framework Apache CXF implementiert sind und über einen Apache Tomcat Server bereitgestellt werden. In einem Planungswerkzeug lassen sich Qualitätsanforderungen beschreiben und mit den Web Services assoziieren. Als Beispielszenario dient ein ETL-Prozess, der mit Pentaho Data Integration (Kettle) erstellt wurde. Im Rahmen von DServ wurde ein Plug-In für Kettle entwickelt, welches es erlaubt, die o. a. Qualitätsplanung (XML) einzulesen, mit dem ETL-Datenstrom zu verknüpfen und dynamisch die in der Planung vorgesehenen Web Services zur Qualitätsmessung aufzurufen. Messergebnisse werden in XML-Dateien abgelegt, die wiederum in ein DashboardWerkzeug eingelesen werden. Dort erfolgt eine graphische Aufbereitung, die es dem/der Qualitätsverantwortlichen erlaubt, zeitnah auf visualisierte Datenqualitätsmängel zu reagieren. Die Softwarekomponenten sind in Java geschrieben und verwenden das Binding-Werkzeug JiBX zur Abbildung von XML auf JavaObjekte und umgekehrt.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Evaluation von Open-Source-Software für System Dynamics hinsichtlich deren Integrierbarkeit

System Dynamics gehört heutzutage zu den bekanntesten Simulationstech-niken und eignet sich insbesondere für die Ableitung langfristig wirksamer Entschei-dungsregeln. Im Forschungsprojekt SimProgno wird diese Simulationstechnik für die simulative Prognose von Fragestellungen im E-Commerce eingesetzt. Ziel des Projek-tes ist die Entwicklung eines Integrations-Frameworks für die Konstruktion komp...

متن کامل

Kontextsensitive Dienste auf Basis von Open-Source-Software

Dieser Beitrag fasst die Ergebnisse einer Diplomarbeit zusammen, in der ein Konzept für die Bereitstellung von Diensten sowie deren kontextsensitive Auswahl und Nutzung entwickelt und prototypisch umgesetzt wurde. Die Umsetzung erfolgte dabei auf Basis von Open-Source-Software und offenen Standards aus dem Bereich des Semantic Web.

متن کامل

Open-Source als Basis für den Vergleich von Softwarearchitektur-Beschreibungssprachen

Die explizite Beschreibung von Softwarearchitekturen benötigt eine adäquate Notation. Derzeit existieren verschiedene Vorschläge für Beschreibungssprachen, deren Vergleich bisher auf Basis von konzeptuellen Merkmalen erfolgte. In diesem Beitragwird ein neuer anwendungszentrierter Ansatz zumVergleich von Softwarearchitektur-Beschreibungssprachen präsentiert, der auf dem Open–Source Informationss...

متن کامل

Community and Commercial Strategies in Open Source Software / Gemeinschafts- und kommerzielle Strategien in der Open-Source-Softwarewelt

This paper describes the recent evolution of business strategies used by companies offering products and services based on free and open source software (FOSS). The primary focus is on companies that develop and release products under an open source license. The paper compares their practices with traditional proprietary software companies and with community-based open source projects, and iden...

متن کامل

Effizientes und bedarfsgerechtes Berichtswesen auf Basis eines modularen Systems aus Open-Source-Produkten

Data-Warehouse-Systeme bzw. Business-Intelligence-Lösungen finden mittlerweile auch in der Hochschullandschaft eine immer weitere Verbreitung. Dabei kann auf fertige Lösungen zum Beispiel von Anbietern der Campus-Management-Systeme gesetzt werden, aber auch auf unabhängige Lösungen. Die Universität Potsdam hat sich für eine eigenständige Lösung auf Basis von flexiblen Open-Source-Produkten ents...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2011